音声情報処理 07
2つのアプローチ
単⼀⾳に対する楽器⾳響特徴抽出
単⼀⾳に対する楽器推定
混合⾳に対する楽器推定
混合⾳からの低次元特徴抽出
混合⾳からの高次元特徴抽出
⼀つの⾳源(楽器,あるいは歌声)から発⽣した⾳声信号波形を扱う 単⼀のメロディラインなど
複数の⾳源から発⽣した⾳声信号波形が組み合わされて⼀つの⾳声信号波形を構成している 聴覚上1つに聞こえる⾳には実は基本周波数以外に整数倍の周波数成分が含まれていること 今:倍⾳の振幅⽐の時間変化や発⾳直後の⾮調波成分も関係と明らかになった
倍⾳振幅⽐率関連
時間変化関連
混合⾳からの特徴抽出のポイント
異なる⾳源の倍⾳成分が同じ周波数で重なる
⾳源分離技術で完全に分解できれば単⼀⾳の分析と同じ問題 混合⾳からの⾳響特徴抽出
テンプレートマッチングによる⾳響特徴抽出
楽器⾳を分離して,各楽器から特徴量抽出をするアプローチは難しい
混合⾳全体を1つの⾳⾊として捉えて混合⾳全体から直接特徴抽出
複数の特徴量の組み合わせによって,混合⾳全体を表現
そもそも混合⾳の抽出⾃体を諦めて特微量を抽出しても実現可能になるアプリケーションは多い エンジニアリングチックな考え方
抽出方法
入力、出力、意味を考えるの大事
となりあうフレーム間における周波数ビンの正規化パワーの⼆乗差の合計値
ある時刻における変化の度合いを見る
時間領域信号$ x(t)の符号が変わる回数
tにおける直線x = 0をまたぐ回数
⾳楽における⾼次な特徴量
⾼次な特徴量の抽出研究
繰り返し構造やサビの抽出
楽器構成推定
ドラムパターンの抽出